标签【imitation learning】

发表时间：2021 文章要点：这篇文章提出了一个Decision Transformer的模型，在offline RL的设定下，不直接去拟合数据，不需要做policy improvement，就可以 ...